import pandas as pd

data = pd.read_csv('data1.csv', header=None)[1:]  # 读取数据\ header=None 不能使用第一行作为列名
# print(data)

# 从data中拿到2， 3列
data = data.loc[:, [2, 3]]  # : 表示要所有的行， [2,3] 要的2, 3列
# print(data)



# 处理类型为两个的数据
"""
# def func1(item):
#     return item.split('/')[0]
#
# def func2(item):
#     if '/' in item:
#         return item.split('/')[1]
#     else:
#         return 'alex_dsb'
#
# data[4] = data[1].map(func1)
# data[5] = data[1].map(func2)

# 数据分开
# data_1 = data.loc[:, [3, 4]]
# data_2 = data.loc[:, [4, 5]]
# data_2 = data_2.loc[data[5]!='alex_dsb']  # 把data_2里面所有的alex_dsb的数据干掉
 
# data_2 = data_2.rename(columns = {5:4})   # 把5号列名改成4号列名
# data = data_1.append(data_2)
"""

# 计算每一种类型的场数平均值
data = data.groupby(2).mean().round(2)   # 根据第2列进行分类算平均值并保留小数后两位
print(data)

# 把处理好的数据保存在文件中
data.to_csv('后面要用的数据1.csv')
